Ощепков М.В.
ИНТЕГРАЦИЯ МЕТОДОВ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ
С ПОМОЩЬЮ ИНТЕРНЕТ

        Парадоксом развития информационных технологий является тот факт, что методы обработки сверхбольших массивов информации все больше ориентируются не на формальные компьютерные методы, а на человека, образ его мышления, творческие способности, интуицию, цели и задачи, стоящие перед ним. Доминирующий сегодня подход в решении задач по извлечению знаний является по сути обобщением реальной практики информационно-аналитической работы в сочетании с современными разработками в области вычислительной техники и искусственного интеллекта. В зависимости от поставленной задачи (ситуации) сотрудник может использовать тот или иной «инструментарий», а ситуационный метод решения проблем является методологической основой технологии поиска и анализа информации, полученной из Интернет.
        Процесс информационно-аналитической работы в силу своей двойственной природы включает в себя формальные и неформальные процессы. Человек, как главное действующее лицо процесса анализа, в своей работе проходит путь от сомнений, неуверенности и неопределенности к ощущению оптимизма, чувству правильности сделанного выбора и, наконец, полной удовлетворенности решением поставленной проблемы. Все это происходит на фоне интеллектуальной обработки информации от неопределенного представления проблемы к постепенному пониманию ее структуры и разрешению проблемы в том виде, как ее понимает аналитик. 
Интернет изменил вектор направленности работы аналитика: от дефицита информационных ресурсов к их избыточному потоку. Практически по любой проблеме исследователь может получить из Интернет сотни тысяч публикаций. В этих условиях поиск информации в Интернет приобретает черты интеллектуального процесса, получившего название data mining.
        Большинство современных исследователей процесса аналитической обработки информации склоняются к тому, что традиционный на сегодня библиографический подход к анализу информации, основанный на принципе «определенность и порядок», будет постепенно заменяться на технологию работы, где аналитик в интерактивном режиме имеет возможность использовать свой интуитивный и формальный опыт работы. Процесс извлечения динамически меняющихся данных и знаний является интерактивным и итеративным. Он включает в себя целый ряд этапов и предполагает возможность многократного принятия решения аналитиком на каждом из них. 
        Работа по поиску необходимой информации может быть разделена на 9 основных этапов:
1) определение, к какой области знаний относится требуемая информация;
2) выбор типа и источников данных;
3) сбор материалов, необходимых для наполнения информационной модели;
4) отбор наиболее полезной информации;
5) выбор метода обработки информации: классификация, кластеризация, регрессионный анализ и т.д.;
6) выбор алгоритма поиска закономерностей;
7) поиск закономерностей, формальных правил и структурных связей в собранной информации;
8) творческая интерпретация полученных результатов;
9) интеграция извлеченных «знаний» . 
        Последний этап работы подразумевает консолидацию данных с ранее полученной информацией. Иными словами, «старые» и «новые» знания должны быть согласованы между собой, а возможные противоречия устранены или иметь соответствующие объяснения.
Hosted by uCoz